هوش مصنوعی می تواند منبع اولیه خبر را پیدا کند
هوش مصنوعی می تواند منبع اولیه خبر را پیدا کند – اخبار بدون منابع مناسب چه خواهند بود؟ برای بیان یک داستان متقاعد کننده، خبرنگاران باید روایت های خبری و اطلاعات قابل اعتماد را بیابند.
چنین اطلاعاتی معمولاً از مجموعه گسترده ای از نشریات، سوابق رسمی و کارشناسان، همه با تعصبات، تخصص، نظرات و سوابق خاص خود به دست می آید.
مجموعه کاندیداهای مصاحبه بسیار زیاد و در عین حال بسیار زیاد است.
با این حال، هوش مصنوعی ممکن است به عنوان یک راهنما عمل کند.
محققان مؤسسه علوم اطلاعات USC در حال ایجاد یک موتور توصیه منبع هستند که برای پیشنهاد مراجع برای روزنامه نگاران طراحی شده است.
“در عمل، برنامه نرم افزاری متن یا موضوعی را تجزیه و تحلیل می کند و منابع مرتبط را با ارجاع متقابل به پایگاه داده ای از مصاحبه شوندگان، کارشناسان یا متخصصان احتمالی پیشنهاد می کند.
منابع اطلاعاتی،” امیلیو فرارا، استاد علوم کامپیوتر و ارتباطات در دانشکده مهندسی USC Viterbi گفت.
“این ابزار میتواند جزئیات تماس، زمینههای تخصصی و کارهای قبلی منابع را ارائه دهد» او افزود.
توسعه این ابزار توسط الکساندر اسپانگر، دکترای علوم کامپیوتر هدایت می شود.
دانشجوی USC Viterbi که قبلاً به عنوان دانشمند داده در نیویورک تایمز کار می کرد.
اسپانگر در حالی که در صنعت روزنامه نگاری غوطه ور بود، شاهد فشار اتاق های خبری سنتی بود.
“من با یک روزنامه نگار محلی صحبت نکرده ام که کاملاً زیاده روی نکرده باشد” او متذکر شد.
“بیابان های خبری و روزنامه ها تعطیل شده اند.
این مناطقی مانند این است که ما واقعاً می خواهیم به آنها کمک کنیم و ابزارهایی برای آنها بسازیم.”
Spanger با انگیزه ارائه منابع مفید برای خبرنگاران، در حال ایجاد ابزارهای هوش مصنوعی مختلف، از جمله یک سیستم توصیه منبع که در مقاله خود، ” ;شناسایی منابع اطلاعاتی در مقالات خبری،» که در کنفرانس 2023 روشهای تجربی در پردازش زبان طبیعی پذیرفته شد و اکنون در arXiv پست شده است.
برای ایجاد یک مدل هوش مصنوعی که میتواند منابع را پیشنهاد کند، محققان ابتدا پایهای را گذاشتند: روزنامهنگاران انسانی در حال حاضر چگونه از منابع در نوشتن خبر استفاده میکنند؟
برای مطالعه این موضوع، آنها مجموعهای از جملات را از بیش از هزار مقاله خبری جمعآوری کردند و منبع اطلاعات و همچنین دسته منبع (مانند «نقلقولهای مستقیم»، «نقلقولهای غیرمستقیم»، «منتشر شده» را حاشیهنویسی کردند.
هزار مقاله خبری مشروح شده، با این حال، داده های کافی برای محققین نبود تا در مورد روش های بی شماری که روزنامه نگاران از منابع در ژانرهای گزارشگری استفاده می کنند نتیجه گیری کنند.
اما، آموزش یک مدل زبان (LM) برای ادامه فرآیند حاشیه نویسی کافی بود.
“مدلهای زبان چارچوبهای هوش مصنوعی هستند که زبان انسان را با تجزیه و تحلیل حجم زیادی از متن برای الگوها و زمینهها پردازش و درک میکنند. فرارا، نویسنده ارشد مقاله توضیح داد.
نویسندگان فاش کردند که LMهایی که محققان آموزش داده اند می توانند منابع منبع را با دقت 83 درصد تشخیص دهند.
اکنون به این LM ها مجهز شده اند، آنها تقریباً 10000 مقاله خبری را حاشیه نویسی کردند و بیشتر به درک ترکیبی بودن نوشتن خبر پرداختند: روزنامه نگاران در حال حاضر چه زمانی و چگونه از منابع استفاده می کنند؟
مدلهای هوش مصنوعی دریافتند که بهطور متوسط، تقریباً نیمی از اطلاعات در مقالات خبری از منابع میآیند و در هر مقاله، معمولاً یک تا دو منبع اصلی وجود دارد (یعنی آنهایی که 20 درصد یا بیشتر از اطلاعات مقاله را شامل میشوند) و دو تا هشت مورد جزئی (آنهایی که سهم کمتری دارند).
“هوش مصنوعی همچنین کشف کرد که جملات اول و آخر بیشترین احتمال را دارند که منبع باشند.”
اسپانگر توضیح داد و افزود که خبرنگاران اغلب با اطلاعات ذکر شده هدایت میشوند و با نقل قولی برای فرستادن خواننده پایان میدهند.
محققان الگوریتم جدید خود را با یک آزمایش دیگر به چالش کشیدند: آیا می توانند تشخیص دهند که آیا منبعی گم شده است؟
اگر هوش مصنوعی بتواند کمبود اطلاعات را تشخیص دهد، آنگاه می توان آن را طوری پیکربندی کرد که بداند چه زمانی باید یک متخصص خاص را برای تکمیل تصویر کامل توصیه کند.
با تجزیه و تحلیل 40000 مقاله با حذف تصادفی برخی از منابع، مدلهای هوش مصنوعی به راحتی متوجه شدند که منبع اصلی غایب است اما با منابع جزئی مشکل داشتند.
اسپانگر گفت: اگرچه ممکن است آنها کمترین اهمیت را برای یک داستان داشته باشند، منابع کمتر واضح نیز ممکن است ارزشمندترین توصیه هایی باشند که روزی یک هوش مصنوعی می تواند ارائه دهد.
“شما اطلاعات زیادی را از شرکت کنندگان اصلی دریافت خواهید کرد، اما صداهای تکمیلی قرار است اضافی را ارائه دهند. رنگ و جزئیات به مقاله،” او خاطرنشان کرد.
“این یک چالش است که موتور را بشناسد و منابع جزئی را توصیه کند، اما ممکن است مفیدترین باشند.”
محققان همچنین فکر می کنند که این ابزار در صورتی که بتواند منابع را به طور متفاوتی توصیه کند، بسیار مهم خواهد بود.
“این می تواند روزنامه نگاران را با صداهای جدید و متنوع فراتر از شبکه معمول خود آشنا کند، بنابراین اتکا به منابع آشنا را کاهش می دهد و به طور بالقوه دیدگاه های تازه ای را ارائه می دهد.”
با این حال، هر سیستم هوش مصنوعی اگر به درستی طراحی نشود، مستعد سوگیری است.
“برای اطمینان از تنوع در پایگاههای اطلاعاتی منبع، استانداردها باید شامل بازنمایی از طیف وسیعی از جمعیتشناسی، رشتهها و دیدگاهها باشند”
جاناتان می، دانشیار پژوهشی علوم کامپیوتر در USC Viterbi و محقق ارشد ISI، آیندهای را تصور میکند که در آن موتور منبعیابی فرآیند گزارشدهی را به سرعت آغاز میکند و به روزنامهنگاران اجازه میدهد کارآمدتر باشند.
“فناوری که می تواند به ما کمک کند کار خلاقانه انجام دهیم و بهترین خلاقیت ما باشد، چیز خوبی است،” می، یکی از نویسندگان مقاله گفت. “برای همین’من به آن امیدوار هستم”
این تیم قصد دارد با خبرنگاران برای جمع آوری بازخورد برای بهبودهای بیشتر همکاری کند.
“با چنین پروژههایی، من واقعاً از صحبت با روزنامهنگاران و درک نیازها، دیدگاهها و آنچه که آنها فکر میکنند کار میکند یا نمیکنند، پیشرفت میکنم» اسپانگر گفت.
“هر راه حلی برای روزنامه نگاری محلی مستلزم جمع شدن دسته ای از افراد مختلف با سوابق مختلف است.”